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摘 要 : [目的 /意义 ] 比较 分 析 语 义 网 技术 发 展 环境 下 国外 代表 性 知识 组 织 体系 管理 工具 的 研究 现状 及 关键 功能 ,梳理 
相关 研究 的 发 展 趋势 。|[ 方法 “过程 ] 通过 网 络 调研 法 , 遗 选 国外 10 个 代表 性 知识 组 织 体系 管理 工具 ,从 结构 定 
义 、 项 目 维护 数据 管理 、 互 操作 性 、 操 作 环境 等 方面 比较 分 析 其 发 展现 状 。 在 此 基础 上 ,为 国内 知识 组 织 体 系 管 


理工 具 的 建设 工作 提供 建议 。[ 


结果 /结论 ] 研究 发 现 ,国内 知识 组 织 体系 管理 工具 的 建设 工作 应 依托 语义 网 、 关 


联 数据 语义 集成 、 语 义 互 操作 等 技术 促进 功能 创新 ,包括 :灵活 设计 并 配置 多 类 型 数据 模型 支持 可 持续 发 展 的 
管理 与 维护 机 制 、 支 持 用 户 分 布 式 协同 管 理 与 控制 知识 驱动 的 数据 迭代 式 更 新 \ 面 向 语义 的 KOS 重用 与 进化 、 建 


设 以 KOS 为 核心 的 知识 组 织 框架 等 。 
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词 表 本 体 


知识 组 织 体系 ( Knowledge Organization Systems, 
KOS 又 称 知识 组 织 系统 ,是 用 于 知识 组 织 的 各 类 规范 
各 六 法 的 统称 ,是 获取 、 利 用 知识 的 重要 手段 ,不 仅 涵 
盖 耶 传统 的 词典 .术语 表 .分 类 表 .主题 词 表 和 和 叙 词 表 ， 
信和 区 括 语义 网 络 、 本 体 等 支持 复杂 语义 描述 的 框 
架 >”。 在 数字 信息 管理 与 应 用 中 ,知识 组 织 体系 作 
为 骨 户 信息 需求 与 知识 资源 之 间 的 桥梁 ,可 帮助 用 户 
快 通 发 现 所 需 的 资源 ”。 最 初 主要 应 用 于 图 书 情报 领 
域 ,如 支持 文档 标注 及 索引 查询 扩展 .术语 提取 ,文本 
分 类 .翻译 等 服务 ,以 提升 对 数字 资源 的 访问 中 。 而 在 
语义 网 络 环境 下 ,尤其 是 从 传统 文件 网 络 向 具有 结构 
化 和 富 含 语义 的 数据 网 络 演进 过 程 中 ,由 于 知识 组 织 
体系 呈现 出 数据 模型 灵活 .语义 表达 能 力 丰富 等 特点 ， 
它 在 各 领域 的 知识 组 织 管理 ,信息 挖掘 分 析 和 开发 利 
用 海量 信息 资源 实践 中 发 挥 日 益 重 要 作用 ,成 为 大 型 
信息 架构 .内容 管理 ,发 现 系 统 等 应 用 的 重要 组 件 。 

伴随 着 知识 组 织 体系 构建 需求 的 增加 ,各 类 机 构 
的 知识 管理 人 员 亚 需 合适 的 工具 支持 知识 组 织 体系 的 


设计 、 维 护 与 发 布 。 知 识 组 织 体系 管理 工具 (以 下 简称 
“KOS 管理 工具 ”) 可 用 于 编制 专业 或 通用 的 词 表 、 本 
体 ,降低 创建 .开发 .管理 知识 组 织 体 系 的 时 间 和 人 力 
成 本 ” 。 它 在 信息 系统 架构 中 起 到 一 个 中 间 件 的 作 
用 , 既 服 务 于 内 容 管理 系统 的 元 数据 管理 、 知识 分 类 、 
知识 标 引 等 模块 ,又 可 以 应 用 于 分 类 导航 .语义 检索 、 
推荐 系统 .智能 问答 等 信息 服务 系统 ( 见 图 1)。 利 用 
KOS 管理 工具 ,用 户 可 以 快速 导入 转化 整合、 修改 已 
有 的 KOS ,还 可 以 从 零 构 建 、 编 辑 满足 自身 需求 的 
KOS ,甚至 还 可 以 自动 对 文本 语 料 进 行 分 析 并 生成 
KOS 的 定制 数据 。 

早 在 20 世纪 90 年 代 ,OCLC 等 图 情 机 构 就 推出 网 
络 数 据 库 及 视窗 编辑 管理 系统 ,以 支持 DDC 、LCSH 等 
词 表 的 编制 5 。 随 着 知识 组 织 体系 类 型 及 标准 的 发 
展 ,KOS 管理 工具 的 功能 也 不 断 演 化 。 除 图 情 机 构 外 ， 
知识 服务 供应 商 等 机 构 也 推出 多 种 类 型 工具 以 支持 知 
识 组 织 体系 的 管理 ” 。 在 知识 组 织 体系 成 为 各 类 机 构 
知识 管理 与 知识 服务 研究 重点 的 发 展 背景 下 ,相关 工 
具 的 分 析 与 评价 也 成 为 十 分 有 意义 的 研究 内 容 。 笔 者 
重点 对 国外 代表 性 KOS 管理 工具 的 关键 功能 进行 评 


* 本 文系 NSTL“ 下 一 代 国 家 科技 创新 知识 服务 开放 系统 ”先期 研发 任务 “STKOS 超级 科技 词 表 内 容 建设 机 制 和 发 展 研究 (理学 部 分 )”( 项 目 
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内 容 管理 系统 


( 术 词 表 / 叙 词 


表 /本 体 ) 


信息 服务 系统 


ET 


内 容 管理 人 员 
(元 数据 管理 员 ; 标 引 员 等 ) 


D 


kos 管理 人 员 
(编制 专家 ; 知识 管理 专员 等 ) 


图 1 KOS 管理 工具 作用 示意 


佑 对 比 与 现状 分 析 , 为 国内 各 类 机 构 及 人 员 的 知识 组 
TES 建设 工作 提供 建议 。 


2 世相 关 研 究 
已 有 文献 关于 KOS 管理 工具 的 评估 研究 主要 采 


< 一 是 从 工具 建设 者 角度 进行 分 析 。 如 :J Gan- 
m sue 
IRET 5s C .数据 输入 ,数据 输出 、 检 索 能 力 等 评 
俏 司 准 , 并 被 广泛 应 用 于 叙 词 表 构 建 时 的 工具 选择 ; 
AZ? Chaudhry 等 "从 准确 性 、 灵 活性 .格式 多 样 性 .多 
Vile Hp .维护 能 力 等 方面 对 Data Harmony 等 12 个 词 
建 工具 进行 评估 ;B. Pérez-León 等 5 重点 关注 与 
语 奖 网 标准 (特别 是 SKOS ) 的 兼容 性 以 及 集成 或 重用 
软 便 的 能 力 , 从 支持 的 词 表 结构 数据 格式 、 编 辑 功能 、 
搜索 功能 .软件 整合 能 力 等 角度 对 Thmanager 等 工具 
进行 比较 ;P. Myrseth 等 加 从 模型 标准 、 工 作 流 、 整 合 
能 力 . 易 用 性 .信息 治理 ,存储 管理 发布. 检索 等 多 个 
角度 出 发 ,对 PoolParty 等 15 个 词 表 及 本 体 工具 进行 评 
价 并 打分 ;M. M. Martínez-González 等 后 关注 语义 网 环 
境 下 的 词 表 管理 工具 的 信息 集成 与 语义 互 操作 性 ,从 
用 途 ,系统 需求 .功能 ,结构 定义 ,一致 性 管理 .信息 互 
操作 等 角度 对 MultiTes 等 6 个 词 表 管 理工 具 进 行 评 
估 ; 白 海燕 四 提出 知识 组 织 工具 管理 软件 的 评价 标准 ， 
包括 结构 定义 能 力 一 致 性 控制 能 力 ,输出 与 共享 交换 
能 力 、 互 操作 支持 能 力 、 开 放 性 与 整合 能 力 。 最 新 的 研 
究 是 G. Mochón 等 05 开展 的 开放 关联 数据 技术 发 展 下 
的 词 表 管理 工具 评估 ,该 研究 制定 了 操作 环境 .概念 及 
关系 定义 .创建 与 编辑 .浏览 与 检索 、 互 操作 性 等 5 个 
评估 维度 , 细 化 为 27 条 评估 标准 ,对 TemaTres 等 10 个 
管理 工具 进行 深度 分 析 。 


二 是 根据 用 户 调研 结果 进行 分 析 。 如 :A. Morshed 
等 '“ 设 定 了 功能 性 、 可 重用 性 ,数据 存储 、 复 杂 性 、 可 
维护 性 、 弹 性 \ 可 靠 性 、 鲁 棒 性 、 可 学 习性 、 可 用 性 、 灵 活 
性 和 可 见 性 等 16 项 标准 , 依 此 收集 60 名 用 户 的 反馈 
数据 ,并 基于 无 监督 的 机 器 学 习 算 法 进行 计算 ,对 Po- 
oParty , Vocbench 和 TopBraid EVN 工具 进行 定量 评估 。 
此 类 方法 相关 研究 较 少 , 量 评 估 标 准 偏 主观 性 。 

总 结 现 有 研究 ,KOS 管理 工具 的 评估 标准 可 概括 
为 操作 环境 ,结构 定义 、 项 目 维护 数据 管理 、 互 操作 性 
等 5 个 维度 : 

(1) 操 作 环境 :较为 通用 的 软件 标准 ,用 于 分 析 软 
件 的 操作 环境 等 因素 ,与 知识 组 织 体系 的 编辑 无 关 ， 
如 :数据 存储 形式 .应 用 类 型 软件 许可 协议 、 兼 容 浏 览 
器 .操作 系统 与 第 三 方 系统 的 交互 与 整合 能 力 等 。 可 
参照 标准 如 :ISO 25010 ISO 25012 ISO 25964-1 等 。 

(2) 结 构 定 义 : 工 具 遵 循 的 数据 模型 标准 ,定义 术 
语 /概念 /类 的 范围 .属性 及 关系 ,决定 知识 组 织 体系 的 
构建 能 力 和 复杂 程度 。 细 则 可 参照 ANSI /NISO Z39. 
19 ISO 25964-1, SKOS, OWLI/OWL2 , ISO/IEC 21838 
等 标准 。 

(3) 项 目 维 护 :对 KOS 的 维护 能 力 , 如 :是 否 文 持 
多 用 户 协同 操作 ,活动 报表 .工作 流 管理 等 。 

(4) 数 据 管理 :对 KOS 数据 的 编辑 与 管理 能 
如 :数据 编辑 (创建 .删除 .修改 等 ) .数据 浏览 与 检索 、 
输入 与 输出 一致 性 与 完整 性 控制 等 。 

(5) 互 操作 性 : 指 知识 组 织 体系 之 间 的 兼容 .整合 
与 互 换 能 力 , 如 :KOS 之 间 的 数据 映射 .多 语种 KOS 转 
换 KOS 数据 整合 等 。 

分 析 发 现 , 现 有 的 KOS 管理 工具 评估 研究 多 集中 
于 对 早期 词 表 或 本 体 建 设 工具 的 分 析 , 并 且 尚 未 形成 
一 个 较 全 面 的 评估 框架 ,而 近年 来 知识 组 织 体系 建设 
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mMm, xd um, AA. 国外 知识 组 织 体系 管理 工具 比较 分 析 与 启示 [J]. 图 书 情报 工作 ,2020 ,64(24) :73 -83. 


需求 发 展 也 促使 KOS 管理 工具 功能 不 断 深化 拓展 。 
笔者 将 在 现 有 研究 的 基础 上 制定 较为 全 面 的 评估 标 
准 , 对 比分 析 KOS 管理 工具 的 基础 功能 及 面向 语义 网 
发 展 的 增值 功能 。 


3 KOS 管理 工具 比较 分 析 


3.1 KOS 管理 工具 调研 与 北 选 

目前 国内 KOS 管理 工具 的 建设 多 基于 特定 任务 
开发 ,专业 性 .领域 性 较 强 , 且 使 用 环境 相对 封闭 ,不 适 
用 于 通用 性 .开放 性 的 知识 组 织 体系 建设 ,如 NSTL 科 
技 知 识 组 织 体系 素材 管理 系统 。 国 外 KOS 管理 工 
具 的 研究 较 早 ,提供 开放 性 的 工具 服务 、 有 多 领域 用 户 
应 用 案例 ,并 且 随 着 知识 组 织 体系 建设 需求 的 发 展 不 
汤 动 态 更 新 。 因 此 ,此 次 选择 国外 有 代表 性 的 KOS 管 
理工 具 作为 调研 对 象 。 
〇 为 尽 可 能 全 面 分 析 当 前 国外 KOS 管理 工具 的 发 

者 进行 了 广泛 搜寻 及 严格 筛选 ,范围 涵盖 KM- 
World 评选 的 知识 管理 领域 Top 100 公司 产品 "" 、 相 关 
关 献 研究 中 出 现 频率 较 高 的 产品 、Taxonomy Boot Camp 
推荐 工具 '" 等。 最终 洲 选 了 10 个 KOS 管理 工具 ( 见 
总 ,它们 具有 以 下 特点 :中 功能 以 支持 词 表 建设 为 
3 时 也 包括 一 些 广 持 词 表 、 本 体 等 多 类 型 知识 组 织 


体系 建设 的 工具 ;@ 产 品 在 近 五 年 内 发 布 , 目 前 仍 在 提 
供 服务 且 版 本 不 断 更 新 。 
X1 KOS 管理 工具 列表 


£ SR 

产品 调研 版 本 
Vocbenchl !8] 词 表 本体 源 ”Vocbench3 
PoolParty [19] 词 表 、 本 体 EE PoolParty Advanced Server 7.2 
Synaptica KMSU20] 词 表 商业 Synaptica KMS 9.0 
Synaptica GraphiteL?1] ” 词 表 、 本 体 DA Synaptica Graphite 3.0 
TopBraid EDG-VM [2] dde. EN TopBraid EDG 6.4 
Mondeca ITM 231 词 表 、 本 体 ”商业 2020 
SKOS Shuttle 24] 词 表 、 本 体 ”商业 2017 


TemaTres 25] 词 表 yi TemaTres 3.1 
Unilexicon [26] 词 表 源 2019 
MultiTes 27] 词 表 商业 ”v2020.04.02u 


注 :调研 版 本 说 明 : 产 品 无 版 本 标识 的 ,以 最 新 版 本 发 布 的 时 间 
为 准 
3.2 KOS 管理 工具 评估 标准 

笔者 在 现 有 KOS 管理 工具 评估 研究 的 基础 上 , 结 
合 近年 来 KOS 管理 工具 功能 的 发 展 , 从 5 个 评估 维度 
出 发 制定 18 条 评估 标准 ,对 所 调研 的 KOS 管理 工具 
进行 全 面 深 入 的 分 析 研 究 。 具 体 评 佑 标准 如 表 2 所 


7N: 


nu X2 KOS 管理 工具 功能 评估 维度 与 标准 
a = 评估 维度 评估 标准 说 明 
定义 数据 模型 标准 遵循 的 数据 模型 标准 ,如 :ANSI /NISO Z39. 19 ISO 25964-1 .SKOS .RDF/RDFS .OWL 等 
®© 模型 扩展 是 否 可 以 对 基础 模型 进行 语义 扩展 ,如 : 词 表 模型 中 增加 自 定义 概念 属性 与 关系 ;建立 " 词 表 - 本 体 " 模型 关联 , 利 
E 本 体 扩展 词 表 的 语义 类 型 ,增强 语义 描述 能 力 
OREN 多 语种 管理 一 个 项 目 可 选用 两 种 以 上 语言 对 数据 进行 编辑 
© 状态 管理 包括 项 目的 编制 状态 以 及 项 目 中 每 条 数据 的 加 工 状态 
版 本 管理 记录 项 目的 版 本 变更 情况 ,对 比 不 同 版 本 之 间 的 内 容 变 化 
历史 记录 管理 记录 项 目 历史 编辑 信息 ,如 最 近 一 次 的 更 新 内 容 \ 时 间 以 及 责任 人 信息 等 数据 
和 户 权 限 管理 可 设置 不 同 用 户 或 用 户 组 对 项 目的 访问 权限 
工作 流 管理 管理 KOS 内 容 变化 ,控制 其 加 工 状态 并 管理 发 布 周 期 
数据 管理 编辑 方式 除 基础 数据 编辑 功能 外 ,工具 可 支持 批量 编辑 拖 搜 编辑 等 方式 对 数据 进行 编辑 
数据 浏览 数据 的 呈现 形式 ,包括 字 顺 结构 .层级 结构 关系 网 络 图 等 其 他 可 视 化 方式 
数据 检索 包括 简单 搜索 ,高 级 搜索 SPARQL 查询 等 方式 
数据 质量 控制 数据 质量 的 审 校 与 监管 ,实现 内 容 的 一 致 性 与 完整 性 控制 
数据 更 新 自动 化 从 文本 语 料 中 挖掘 相关 的 术语 并 补充 至 KOS 内 容 中 
互 操作 性 输入 与 输出 支持 标准 格式 数据 的 导入 和 输出 ,实现 与 其 它 系统 的 数据 共享 ,包括 但 不 限于 CSV , RDE/XML , N-Triple , Turtle , 
N3 TriX ,TriG ,Zthes/XML 等 格式 数据 
KOS 内 容 映射 支持 两 个 或 多 个 KOS 之 间 的 内 容 映 射 
放 关联 数据 集 支持 将 KOS 数据 发 布 为 开放 关联 数据 ,或 者 与 LOD 云 中 的 数据 建立 关联 关系 
操作 环境 数据 存储 形式 包括 关系 数据 库 .RDF 数据 库 等 本 地 数据 存储 形式 ,以 及 外 部 数据 库 访问 
放 集成 与 各 种 标 引 资源 管理 系统 或 搜索 引擎 .检索 工具 整合 ,提供 开放 接口 如 API 或 通过 Web Services 供 这 些 应 用 系统 
调用 
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3.3 ”对比 评估 与 发 展现 状 分 析 

基于 以 上 评估 标准 ,笔者 通过 产品 文档 调研 .客服 
演示 、 工 具 试 用 、 实 例 数 据 测试 等 方式 对 所 闭 选 的 10 
个 KOS 管理 工具 功能 进行 深入 测试 和 对 比 评估 ,并 根 
据 各 项 评估 结果 分 析 当 前 国外 KOS 管理 工具 的 发 展 
趋势 。 
3.3.1 结构 定义 

(1) 遵 循 多 样 化 数据 模型 标准 。 对 代表 性 KOS 管 
理工 具 支持 的 数据 模型 标准 进行 分 析 , 发 现 目前 许多 
工具 并 不 会 着 重 区 分 “ 词 表 管理 工具 ”与 “本 体 管 理工 


HC ,更 多 的 是 既 文 持 叙 词 表 标准 (ANSIANISO Z39. 19 
ak; ISO 25964-1) 又 支持 本 体 标准 (OWL 与 RDF) ,尤其 
是 适用 于 各 种 受 控 词 表 的 SKOS EUM T 。 这 种 趋势 是 
正常 的 ,因为 一 个 机 构 往 往 需 要 构建 多 种 不 同类 型 的 
知识 组 织 体系 。 新 兴 的 软件 提供 商 已 经 将 词 表 管理 与 
本 体 管 理 功 能 结合 在 一 起 ,包括 Vocbench , PoolParty , 
TopBraid EDG-VM、 Mondeca ITM, SKOS Shuttle 等 。 
Synaptica 是 一 个 例外 , 它 提供 了 两 个 产品 :主要 用 于 传 
统 叙 词 表 管 理 的 Synaptica KMS 以 及 主要 用 于 本 体 管 
理 的 Synaptica Graphite。 具 体 如 表 3 所 示 : 


X3 KOS 管理 工具 结构 定义 能 力 比较 


KOS 管理 工具 
人 PT 
KMS Graphite EDG-VM ITM Shuttle 
dapout 739.19 M 
N ISO 25964-1 v 
O RDF/RDFS V v v v v v v v 
e SKOS v v v v v v v v 
三 OWL v v M M M M 
a 自 定义 属性 /关系 v v v v v v v v 
基于 本 体 的 词 表 模型 扩展 V v v v v v 
和 R302) 灵活 性 .可 定制 的 模型 扩展 方式 。 大 数据 环 复 用 于 原 词 表 。 


境 书 , 随 着 知识 组 织 休 量 的 扩大 ,实体 之 间 的 关系 表达 
做 漳 益 丰 富 。 例 如 ,一 般 的 作词 表 中 的 关系 仅 包含 用 、 
代 闹 分 . 参 族 等 ,属性 包括 定义 .范围 注释 .历史 注 
EET - 般 注 释 等 ,一 般 都 不 超过 10 种 。 但 是 ,新 型 知识 
AAKRI UMLS 的 语义 网 络 中 就 包含 了 54 种 语义 
关 索 ”。 基 础 的 叙 词 表 数 据 模型 已 不 足以 支撑 新 型 
知 馆 组 织 体系 的 语义 表达 ,需要 进行 扩展 。 常 见方 式 
是 在 词 表 模型 的 基础 上 增加 自 定义 数据 属性 或 关系 属 
性 (参照 ISO 25964-1 标准 )。 除 TemaTes、 Unilexicon 
外 ,目前 主流 的 KOS 管理 工具 都 支持 对 词 表 概念 进行 
自 定义 属性 /关系 扩展 。 

此 外 ,许多 KOS 管理 工具 开始 文 持 建 立 “ 词 表 - 
本 体 "模型 之 间 的 关联 ,利用 本 体 模型 扩展 词 表 模 型 的 
语义 类 型 .属性 及 关系 ” 。 此 种 方式 得 益 于 SKOS 与 
OWL 的 兼容 性 。 例 如 ,PoolParty 提供 自 定义 知识 模型 
的 功能 ,建立 词 表 内 容 与 本 体 的 关联 ,在 语义 层 实现 对 
词 表 异型 的 扩展 描述 ,为 单一 的 “概念 "类 型 增加 新 的 
本 体 类 ,并 继承 该 本 体 类 所 有 的 属性 及 关系 ,实现 流程 
如 图 2 所 示 。TopBraid EDG 也 提供 类 似 功 能 , 它 支 持 


本 体 模型 ， 定 义 类 、 属 性 、 关 系 E MA 


可 选择 多 个 本 体 的 部 分 内 容 进行 融合 EA E 


| 应 用 


选择 相关 概念 ， 对 其 语义 进行 扩展 i : 


图 2 PoolParty 基于 本 体 的 词 表 模型 扩展 方法 示意 


3.3.2 项 目 维 护 

知识 组 织 体系 的 构建 过 程 中 往往 需要 同时 管理 多 
个 项 目 ,以 及 基于 网 络 环境 的 多 用 户 协 同 编辑 。 除 基 
础 的 项 目 浏览 .项目 注册 功能 之 外 ,KOS 管理 工具 也 在 
多 语种 管理 ,状态 管理 ,版 本 管理 ,历史 记录 管理 .权限 
管理 .工作 流 管理 等 方面 不 断 提 升 细节 化 的 处 理 。 

(1) 支 持 国际 化 发 展 的 多 语种 管理 。 随 着 不 同文 
化 和 语言 背景 的 信息 交流 需求 的 增加 ,支持 多 语种 信 
息 组 织 和 检索 的 工具 也 日 益 重 要 ,多 语种 是 知识 组 织 
体系 发 展 的 一 个 重要 趋势 ,这 也 促使 KOS 管理 工具 提 


供 相 应 的 管理 功能 。 除 TemaTres , Unilexicon 在 一 个 项 


在 本 体 管理 中 对 词 表 模型 (SKOS ,SKOS-XL) 进行 扩展 
描述 ,为 概念 类 (skos: concept) 添加 新 的 子 类 (如 coun- 
try ,city 等 ) ,为 其 添加 属性 及 关系 ,并 将 扩展 后 的 模型 


目 中 只 能 选择 一 种 语言 对 数据 进行 编辑 之 外 ,大 部 分 
KOS 管理 工具 都 支持 多 语种 知识 组 织 体 系 的 数据 编 
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dom, AX, Xp. 国外 知识 组 织 体系 管理 工具 比较 分 析 与 启示 [ J]. 图 书 情报 工作 ,2020 ,64(24) :73 - 83. 


表 4 KOS 管理 工具 项 目 维护 能 力 比较 


KOS 管理 工具 


icis uU B Rude Eia 1 m 
Y — KMS Graphie  EDG-VM ITM Shuttle 
多 语种 管理 多 语种 编辑 v v v v v vV v v 
自动 翻译 v 
状态 管理 数据 加 工 状态 v v v v v v v v 
历史 记录 管理 变更 信息 记录 V v v v v v v v 
历史 记录 检索 V M M 
版 本 管理 版 本 关联 v v v v 
版 本 对 比 V V 
用 户 权限 管理 用 户 角色 权限 M v v v v v v v 
项 目 权限 控制 V V v 
工作 流 管理 审批 工作 流 V v v v v v v 


辑 , 如 Vocbench , PoolParty 等 工具 支持 用 户 设置 KOS 
数据 浏览 与 编辑 时 的 主语 言 以 及 其 他 偏好 的 语种 ,并 
DH 显示 次 序 。 此 外 ,PoolParty 还 支持 基于 DBpe- 
Qantas Ins a 对 结果 可 选择 添加 到 


IK Pda e 及 的 状态 ` 历 史记 录 与 版 


ak. 知识 组 织 体系 的 状态 管理 需要 分 层次 进行 ， 


xt KOS 和 KOS 中 的 单个 术语 应 采用 不 同 的 状态 
管理 策略 。 在 项 目 层 面 ,知识 组 织 体系 的 状态 指 KOS 


HEPI BT AE HO E fiy 8 周期 阶段 ,可 采用 开发 中 、 维 护 
'" 沁 废 弃 等 状态 信息 进行 描述 在 数据 层面 ,状态 管 
理 未 要 对 KOS 中 的 单个 术语 的 状态 (如 活动 中 已 废 


EDG-VM 还 支持 对 不 同 版 本 的 KOS 内 容 进 行 对 比 , 形 
成 数据 对 比 报告 。 

(3) 支 持 用 户 协 同 工 作 的 权限 与 工作 流 管理 。 知 
识 组 织 体系 的 建设 过 程 中 可 能 涉及 项 目 管理 员 、 各 领 
域 词 表 专家 最 终 用 户 的 大 规模 协同 工作 ,因此 需要 为 
不 同 用 户 授予 不 同 的 访问 权限 ,避免 因 权 限 控制 缺失 
或 操作 不 当 引 发 的 风险 问题 。 最 简单 的 方式 是 为 不 同 
昌 户 或 工作 组 分 配 不 同 的 角色 ,通过 角色 控制 用 户 对 
KOS 数据 的 访问 ` 编 辑 .审核 ,管理 等 权限 ,这 种 方式 也 
被 多 数 KOS 管理 工具 采用 。 男 一 种 方式 是 在 角色 控 
制 的 基础 上 ,为 用 户 设置 每 个 项 目的 访问 权限 ,这 种 方 
式 更 为 严谨 。 例 如 :Vocbench 除 基础 的 用 户 角 色 管 理 


Tm 


RE) 进行 描述 。 目 前 多 数 KOS 管理 工具 仅 支持 在 数 
MODE CHER, 不 支持 项 目 层面 的 状态 管理 。 
-GNISO 建议 , 词 表 管理 系统 应 当 自动 记录 数据 最 近 
一 次 的 更 新 内 容 .时 间 以 及 责任 人 信息 ,以 保证 任何 变 
更 信息 都 能 够 进行 追溯 和 了 验证””。 除 TemaTres、 
Unilexicon 之 外 ,多 数 KOS 管理 工具 提供 历史 记录 管 
理 功 能 ,自动 记录 每 条 数据 最 近 一 次 的 更 新 内 容 \、 时 间 
以 及 编辑 人 员 等 数据 ,保证 KOS 项 目的 任何 变更 信息 
都 能 够 进行 追溯 和 了 验证。Vocbench ,PoolParty , TopBraid 
EDG-VM 还 支持 对 历史 记录 进行 检索 和 筛选 ,便于 直 
观 发 现 特定 时 间 段 ,特定 术语 的 信息 变更 。 
此 外 ,知识 组 织 体系 的 建立 不 是 一 劳 永 逸 的 ,需要 
有 动态 更 新 机 制 ,形成 对 多 个 版 本 的 分 类 与 管理 。 版 


之 外 ,每 个 项 目 都 包含 一 个 访问 控制 列表 ,包含 Pro- 
jectConsumer, AccessLevel > 实体 对 , AccessLevel 可 以 
设置 R( 读 ) 或 者 RW( 读 / 写 ) 两 个 值 ,对 用 户 的 访问 
权限 进行 详细 配置 。 

为 便于 管理 KOS 内 容 变化 .控制 其 加 工 状态 并 管 
理发 布 周期 ,往往 需要 引入 认证 工作 流 , 对 用 户 的 各 项 
操作 进行 核查 ,这 一 机 制 与 KOS 项 目的 状态 管理 、 版 
本 管理 .历史 记录 管理 .权限 管理 等 紧密 结合 。 目 前 许 
多 KOS 管理 工具 有 工作 流 管理 功能 ,如 :Vocbench 在 
其 数据 层 构建 了 一 个 追踪 改变 装置 , 当 数据 发 生变 化 
(删除 添加) 时 ,会 同时 保存 操作 元 数据 ,授权 用 户 可 
以 选择 接受 或 者 拒绝 某 个 操作 ;PoolParty 提供 了 一 个 
简单 的 审批 工作 流 , 概 念 被 创建 编辑、 导入 或 通过 推 


本 控制 的 概念 在 知识 组 织 体系 维护 中 非常 重要 ,制定 
良好 的 版 本 控制 策略 使 得 内 容 更 新 更 容易 ,并 且 更 适 
用 于 自动 化 的 流程 。 目 前 Vocbench , PoolParty , Synapti- 
ca 及 TopBraid EDG-VM 允许 授权 用 户 生 成 新 版 本 的 
KOS 数据 ,并 建立 不 同 版 本 之 间 的 关联 。TopBraid 


荐 系统 添加 时 ,其 默认 状态 为 “草稿 ” ,经 审查 人 员 批 
准 后 ,状态 会 自动 修改 为 “批准 ” ;TopBraid EDG-VM 通 
过 认证 工作 流 对 数据 变更 进行 控制 ,用 户 对 KOS 项 目 内 
容 进行 编辑 时 ,会 先生 成 一 个 副本 ,用 户 所 有 的 编辑 操 
作 都 在 此 副本 上 进行 ,只 有 当 副 本 中 内 容 的 变化 被 审查 
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人 员 通 过 后 ,相关 变化 才 会 同步 到 原 KOS 数据 中 。 
3.3.3 ”数据 管理 
数据 管理 是 KOS 管理 工具 中 最 核心 的 功能 模块 ， 


可 以 实现 KOS 数据 的 浏览 .编辑 检索、 质量 控制 更 
新 等 操作 。 具 体 管理 功能 模块 比较 如 表 5 所 示 : 


表 5 KOS 管理 工具 数据 管理 能 力 比较 


KOS 管理 工具 


Wi Volbendh ‘Bodlbaity. bio -Synaptic Topirad Mondes XE Tt. E 1 
Y KMS Graphite  EDC-VM ITM Shuttle 
编辑 方式 批量 编辑 v v v v v v v 
拖 搜 编辑 M v v v 
自动 拼写 建议 v 
数据 浏览 层级 结构 v v v v v v v v v v 
关系 网 络 图 v v v v v v v 
其 他 形式 v v v v vV 
数据 检索 简单 检索 M M M v v v v v v v 
高 级 检索 v v v v v v v v v 
AX SPARQL 查询 V v v V v v 
数据 质量 控制 检测 报告 v v v v v v v 
C 实时 检测 v V v v y Y 
C 自动 修复 V V 
C 更 新 ”基于 文本 语 料 的 术语 抽取 v v 


(1) 多 样 化 数据 编辑 、 浏 览 与 检索 形式 。 为 提升 


字符 结束 字符 ,包含 字符 等 ) ,并 且 与 数据 筛选 功能 进 
行 结合 。Vocbench 、PoolParty 等 工具 还 支持 SPARQL 
语言 查询 功能 ,便于 有 经 验 的 用 户 快 速 定 制 检索 语句 。 


提供 自动 


KOS 数据 的 可 视 化 呈现 ,可 以 让 终端 用 户 能 对 其 
结 枸 和 内 容 有 一 个 丰富 的 ` 形 象 化 的 理解 ,随时 审视 纺 
制 晶 的 数据 并 反馈 修改 建议 。 不 同 工 具 也 衍生 出 多 种 
可 钢化 形式 ,如 层级 结构 、 关 系 网 络 、 可 视 映射 图 等 。 
中 层级 结构 :又 可 称 为 树 形 结构 ,这 是 KOS 管理 工具 
提供 的 最 基础 的 数据 可 视 化 形式 ,按照 KOS 数据 中 的 
“上 位 概念 -下 位 概念 "或 “ 父 类 - 子 类 "关系 显示 所 
有 数据 ,几乎 所 有 KOS 管理 工具 都 支持 层级 结构 的 数 
据 展示 方式 。 思 关系 网 络 图 :多 数 KOS 管理 工具 支持 
通过 “节点 -关系 链接 "来 显示 数据 关系 ,如 SKOS 
Shuttle, Mondeca ITM 等 。@) 其 他 形式 :如 PoolParty 采 
用 可 视 化 映射 图 显示 概念 的 所 有 的 关系 ,并 用 不 同 的 
颜色 进行 区 分 ;Synaptica KMS 通过 饼 图 显示 数据 分 布 
情况 ;Synaptica Graphite 可 通过 项 目的 结构 视图 显示 不 
同 KOS 模型 之 间 的 关联 关系 ; Unilexicon 通过 卡片 形 
式 文 持 用 户 对 数据 层级 进行 调整 .排序 。 

同时 ,多 数 KOS 管理 工具 支持 简单 检索 与 高 级 检 
索 功 能 。 高 级 检索 时 可 对 标签 .关系 、 属 性 等 内 容 进行 
WR , 文 持 多 种 匹配 模式 (如 精确 匹配 ,模糊 匹配 .起 始 


(2) 认 和 人 管理 流程 的 数据 质量 控制 。 知 识 组 织 体 
系 建设 工作 离 不 开 对 数据 内 容 及 其 质量 的 审 校 与 监 
管 ,这 一 工作 往往 需要 人 工 的 参与 ,但 优秀 的 KOS 管 
理工 具 可 以 提供 多 种 数据 质量 检测 方案 ,辅助 人 工 审 
校 过 程 ,提升 知识 组 织 体系 的 构建 效率 。 总 体 来 讲 ， 
KOS 数据 质量 检测 主要 分 为 结构 检测 与 标签 检测 两 个 
方面 :结构 检测 用 于 验证 数据 结构 的 完整 性 ,如 关系 缺 
失 或 逻辑 循环 错误 等 ;标签 检测 重点 关注 知识 对 象 描 
述 的 完整 性 与 一 致 性 ,如 词 形 重复 性 .信息 缺失 等 。 
KOS 管理 工具 对 质量 管理 的 支持 存在 两 个 层面 :中 在 
KOS 数据 导入 后 或 完成 一 个 阶段 的 加 工 任务 后 ,对 
KOS 数据 进行 整体 的 质量 问题 检测 ,并 提供 检测 报告 ; 
在 编辑 KOS 数据 时 实时 进行 检测 ,将 发 现 的 错误 实 
时 反馈 给 用 户 。 如 :PoolParty 通过 集成 qSKOS 来 支持 
数据 的 质量 管理 , 它 可 以 设置 许多 质量 评估 标准 ,并 在 
有 户 交 互 过 程 中 实时 检测 ;TopBraid EDG-VM 通过 
SHACL ( Shapes Constraints Language, 结构 性 约束 语 
言 ) ”实现 完整 性 问题 的 实时 检查 。 有 些 工 具 如 
Vocbench 在 检测 到 错误 之 后 还 可 以 提供 操作 建议 ,用 
户 可 一 键 式 实现 标签 或 结构 错误 的 自动 修复 。 

(3) 基 于 机 带 学 习 的 数据 更 新 。 随 着 自然 语言 处 
理 、 机 器 学 习 技 术 的 发 展 ,实现 KOS 内 容 的 智能 化 更 
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新 成 为 当前 研究 热点 和 发 展 趋势 ,一 些 KOS 管理 工具 
也 在 研究 如 何 从 文本 语 料 中 挖掘 相关 的 术语 并 补充 至 
KOS 内 容 中 。 例 如 :(DPoolParty 支持 从 文本 语 料 中 自 
动 挖掘 相关 的 术语 /概念 ,并 将 其 作为 候选 词汇 添加 到 
词 表 中 。 术 语 抽取 过 程 中 采用 互信 息 得 分 (Mutual In- 
formation Score, MIS) 内容 术 语 分 数 ( Content Term 
Score, CTS) ,术语 频率 等 第 选 指标 进行 综合 计算 ,得 到 
候选 术语 o SKOS Shuttle 支持 基于 多 语种 (德语 、 
英语 西班牙 语 .法语 ) 语 料 的 信息 抽取 ,并 使 用 tidf 
值 对 每 个 术语 进行 加 权 。 用 户 可 对 抽取 的 结果 进行 得 
选 、 排 序 , 同 时 可 选择 将 识别 到 的 新 术语 添加 到 已 有 词 


3.3.4 互 操作 性 

知识 组 织 体系 的 互 操 作 是 当前 KOS 管理 工具 发 
展 的 重要 特征 ,可 实现 从 单一 知识 组 织 体系 的 独立 建 
设 向 各 类 知识 组 织 体系 的 整合 发 展 ,从 单一 领域 的 局 
部 建设 向 跨 领 域 的 集成 发 展 。 相 应 的 实现 方法 包括 输 
入 与 输出 KOS 内 容 映 射 .开放 关联 数据 集成 等 。 标 准 
格式 数据 的 输入 和 输出 是 一 种 最 基础 的 互 操作 方式 ， 
也 是 衡量 KOS 管理 工具 共享 和 交换 能 力 的 重要 因素 。 
常见 的 格式 如 :Txt、Excel/CSV , SKOS/SKOS-XL , RDE/ 
XML N-Triples „Turtle JSON 等 。 各 工具 对 不 同 格式 数 
据 的 支持 性 如 表 6 所 示 : 


X6 KOS 管理 工具 互 操作 性 比较 


KOS 管理 工具 


评价 标准 


im. ^| 
BE 
N Vocbench PoolParty 


KMS 


Synaptica Synaptica TopBraid 


Graphite 


Mondeca SKOS 
TemaTres Unilexicon MultiTes 
EDG-VM ITM Shuttle 


- 
iA nin m 5 


— 


c Excel/CSV — — 


— 


SKOS/SKOS-XL — 


RDF/XML 


N N-Triples Ey PM 
Turtle — $= 
a JSON/JSON-LD 一 = 


p= KOS 内 容 映射 v v v 


(= 
-开放 关联 数据 集成 V V V 


说 明 :“ 一 ”代表 数据 输入 ,“" 代 表 数 据 导出 
(1) 半 自动 化 KOS 内 容 映 射 。 随 着 数据 库 集 成 应 
用 与 发 展 ,出 现 了 跨 库 、 跨 语言 . 跨 领 域 的 操作 需求 ,不 
同 知识 组 织 体系 之 间 的 互 操作 成 为 急需 解决 的 重要 问 
题 。 目 前 解决 互 操作 的 最 有 效 方法 是 实现 KOS 间 的 
映射 , 即 在 两 个 或 多 个 KOS 间 建 立 词汇 对 应 关系 ,使 
其 所 标 引 的 结果 间 也 能 进行 关联 。 多 数 KOS 管理 工 
具 支 持 通过 机 器 自动 识别 的 方式 进行 半自动 化 映射 ， 
例如 : Vocbench 文 持 通过 基于 标签 的 半自动 化 搜索 建 
立 不 同 KOS 项 目 之 间 的 映射 ,相关 实体 与 关系 经 验证 
之 后 采用 标准 的 RDFSAOWL 或 SKOS 映射 属性 建立 关 
联 ,如 两 个 SKOS 概念 可 以 通过 SKOS :exactMatch 或 
SKOS :closeMatch X 77 o 
(2) 面 向 开放 关联 数据 的 集成 。 一 方面 支持 将 词 
表 发 布 为 开放 关联 数据 , 另 一 方面 支持 从 LOD 数据 集 


中 获取 数据 ,扩展 当前 知识 组 织 体系 内 容 。 例 如 Pool- 
Party , TopBraid , Vocbench 等 工具 可 以 将 平台 中 的 KOS 
内 容 在 网 络 上 发 布 为 关联 数据 ,并 且 与 其 他 开放 数据 
集 ( 如 DBPedia , WordNet , LCSH , GeoNames ) 中 的 资源 
建立 关联 关系 ,从 而 成 为 关联 开放 数据 (LOD) 云 的 一 
部 分 。Vocbench PoolParty 还 支持 自动 与 DBPedia 等 
LOD 数据 进行 匹配 ,将 发 现 的 相关 数据 自动 添加 至 
KOS 内 容 中 。 

3.3.5 操作 环境 

KOS 管理 工具 操作 环境 比较 见 表 7。 

(1) 支 持 分 布 式 语义 数据 存储 。 随 着 知识 模型 的 
演变 以 及 数据 量 的 激增 , KOS 管理 工具 应 当 支 持 大 规 
模 、 分 布 式 语义 数据 的 存储 与 管理 。 早 期 的 KOS 管理 工 
具 多 数 以 关系 数据 库存 储 数据 ,如 TemaTres .Unilexion , 
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R7 KOS 管理 工具 操作 环境 比较 


KOS 管理 工具 


评价 标准 Synaptica Synaptica — TopBraid Mondeca SKOS "m ] 
Vocbench — PoolParty TemaTres Unilexicon — MultiTes 
i KMS Graphite | EDG-VM ITM Shuttle 
数据 存储 关系 数据 库 V V v v 
RDF 数据 库 V v Vo ^ xw y 
远程 数据 库 访问 Yo X vo v v 
开放 集成 第 三 方 API 调用 /Web 服务 访问 V V V V V AJ aj 4 
与 配套 工具 的 集成 V V V 


MultiTes 等 。 现 在 ,RDF4J、AllegroGraph „Jena TDB Vir- 
tuoso , GraphDB ,StarDog „MarkLogic 等 RDF 数据 库 逐 渐 
成 为 主流 KOS 管理 工具 的 首选 ,例如 Vocbench 、PoolP- 
arty 选择 RDF4J 作为 默认 的 本 地 语义 仓储 。 除 本 地 数 
据 存储 之 外 ,一 些 KOS 管理 工具 还 支持 远程 访问 其 他 
存储 ,实现 数据 的 分 布 式 管理 ,如 :Vocbench、PoolParty 
ra 持 访 问 、 调 用 MarkLogic, Stardog , Allegrograph , 
DB „Virtuoso 等 远程 存储 的 数据 。 

52) 与 其 他 应 用 的 无 颖 集成 。 目 前 , 越 来 越 多 的 
KebS 管 理工 具 开 始 支 持 与 内 容 管理 系统 及 搜索 软件 相 
Hips Ag KOS 数据 嵌入 到 内 容 标注 ,信息 检索 .知识 发 
现 移 统 平 台中 。 例 如 :Synaptica 产品 可 以 与 多 种 第 三 
JÉBEIAR £i , 61456 SharePoint , Google Search , Apache 
SdhOpenText , MarkLogic 以 及 IBM Watson 等 ,扩大 应 
用 范围 。 而 PoolParty , TopBraid , Mondeca 还 提供 相关 
IE 委 组 件 ,支持 用 户 按 需 集成 。 如 :PoolParty 语义 套件 


O~ 


8318-53 4e ID AAEE GC eR B AS 
TEE AE XE .关联 数据 编制 .语义 智能 应 用 等 功能 组 件 ， 


可 息 据 用 户 需求 自由 组 合集 成 ;Mondeca ITM 可 以 与 
内 容 标 引 管 理工 具 集 成 ,并 从 中 提取 实例 对 KOS 数据 
进行 扩充 。 这 一 发 展 极 大 提升 KOS 管理 工具 的 开放 
性 与 整合 能 力 ,实现 与 其 他 应 用 或 管理 系统 之 间 的 动 
态 、 实 时 的 交互 ,进而 扩大 和 提升 KOS 的 应 用 范围 和 
实用 价值 。 


4 ”启示 


研究 发 现 , 为 支撑 大 数据 环境 与 智能 应 用 ,国内 
KOS 管理 工具 的 建设 不 仅 需 要 支持 基础 的 KOS 生命 
周期 管理 (创建 .评估 发布、 维护 .进化 ) ,还 应 借鉴 先 
进 KOS 管理 工具 的 发 展现 状 ,结合 实际 知识 组 织 体系 
构建 需求 ,重点 从 以 下 几 个 方面 提升 工具 性 能 : 
4. 灵活 设计 并 配置 多 类 型 数据 模型 

知识 组 织 体系 的 构建 要 考虑 的 是 “如 何 合理 有 效 
地 表示 知识 ”, 即 创建 一 个 标准 化 .抽象 化 的 模型 来 描 


述 现实 世界 中 的 对 象 , 支 持 机 器 理解 。 对 于 氢 词 表 、 分 
类 表 、 术 语 表 等 KOS ,其 模型 中 基础 的 元 素 为 术语 或 概 
念 ;而 对 于 本 体 或 知识 图 谱 来 讲 , 其 知识 模型 中 包含 了 
类 类 的 属性 .类 之 间 的 关系 及 相关 的 规则 。 随 着 
知识 图 谱 研 究 热潮 的 兴起 ,如 何 对 传统 知识 组 织 体系 
进行 语义 扩展 ,快速 构建 轻 量 级 本 体 ,成 为 KOS 管理 
工具 或 需 解 决 的 问题 。 工 具 应 当 提供 不 同 的 知识 组 织 
方案 来 支持 灵活 的 数据 建 模 , 包 括 : 基 于 术语 的 词 表 、 
基于 概念 的 词 表 、 描 述 复杂 语义 关系 的 本 体 等 。 具 体 
方案 设计 可 以 参照 SKOS/SKOS-XL , ISO-THES ^"! 、 
RDF/XML 等 模型 标准 进行 扩展 。 
4.2 支持 可 持续 发 展 的 管理 与 维护 机 制 

NISO 指出 , 随 着 时 间 推 移 ,知识 组 织 体系 的 访问 
需要 足够 的 文档 合适 的 维护 策略 、 积 极 的 管理 ”” 。 
为 实现 知识 组 织 体系 的 可 持续 性 发 展 , 需 要 对 各 种 类 
型 知识 组 织 体 系 提供 权威 的 集中 化 的 存储 与 管理 , 支 
FF KOS 的 发 现 与 重用 ,包括 状态 管理 .权限 管理 .历史 
记录 与 版 本 管理 等 。 所 调研 的 KOS 管理 工具 中 ,多 数 
重点 关注 微观 层面 的 数据 状态 管理 ,并 不 支持 宏观 层 
面 的 项 目 状态 管理 。 因 此 ,KOS 管理 工具 应 当 对 项 目 
的 开发 .维护 .发布 等 状态 提供 更 加 细 化 的 管理 方案 。 
4.3 支持 用 户 分 布 式 协同 管理 与 控制 

当前 知识 组 织 体系 的 建设 具有 数据 规模 大 、 和 覆盖 
领域 广泛 等 特点 ,这 也 决定 其 构建 过 程 需要 多 领域 多 
机 构 多 层次 用 户 协同 编制 和 维护 ”“ 。 这 就 需要 KOS 
管理 工具 :由 支 持 分 布 式 协 同 工 作 , 便 于 不 同 群 体 用 户 
办 作 完 成 KOS 设计 与 编辑 工作 ,提高 工作 效率 ;@ 具 
备 灵活 的 权限 和 任务 管理 机 制 ,为 不 同 权 限 的 用 户 分 
配 不 同 层级 的 任务 (如 编辑 .审核 等 ) ,并 支持 进度 管 
理 。 所 调研 的 KOS 管理 工具 中 , 虽 大 多 数 支 持 不 同 权 
限 用 户 的 协同 化 编制 ,但 并 不 具备 完善 的 从 任务 分 配 、 
数据 编辑 .数据 审核 到 项 目 发 布 的 全 流程 任务 管理 功 
能 。KOS 管理 工具 建设 时 ,应 根据 实际 的 项 目 协同 工 
作 需 求 ,提供 不 同 层级 的 角色 权限 ,支持 自 定义 工作 


80 


f^ Dn A 
ChinaXiv Q IF 期 


F! 


Amm, AX, PE. 国外 知识 组 织 体系 管理 工具 比较 分 析 与 启示 [ J]. 图 书 情报 工作 ,2020 ,64(24) :73 -83. 


流 ,提供 完整 的 任务 管理 功能 。 
4.4 ”实现 知识 驱动 的 数据 迭代 式 更 新 

知识 组 织 体系 的 构建 是 不 断 迭 代 的 ,在 大 数据 时 
代 , 如 何 尽 可 能 地 节省 人 力 物力 ,采用 机 器 学 习 等 先进 
技术 对 KOS 数据 进行 智能 化 更 新 已 成 为 重要 的 研究 
课题 局] 。 目 前 PoolParty SKOS Shuttle 已 支持 基于 文 
本 语 料 的 术语 抽取 ,但 算法 相对 简单 , 仅 通过 词 频 、 互 
信息 等 统计 算法 判断 术语 的 相关 性 , 且 并 未 实现 关系 
的 挖 气 。 为 实现 知识 组 织 体系 的 快速 构建 ,KOS 管理 
工具 应 当 拓展 在 数据 挖 气 方 面 的 性 能 ,支持 搭载 机 器 
学 习 、 深 度 神经 网 络 等 多 种 算法 模型 实现 术语 及 关系 
的 抽取 。 

4.5 面向 语义 的 KOS 重用 与 进化 

一 语义 网 鼓励 数据 共享 和 数据 重用 ,对 已 有 术语 的 
重病 能 够 最 大 化 KOS 的 使 用 价值 ,扩大 其 传播 范围 并 
保持 生命 力 。 例 如 :通过 翻译 .映射 合并、 定制 等 广 
xA y RUB KOS 管理 工具 中 已 有 的 数据 构建 新 的 知 
训 吾 织 体系 ,支持 根据 用 户 需 求 动态 集成 与 分 解 。 目 
MEOS 管理 工具 提供 内 容 映 射 以 及 开放 关联 数据 的 
仙台 功能 ,但 对 于 现 有 数据 的 动态 化 集成 与 定制 支持 
ERX RK KOS 管理 工具 可 以 通过 以 下 方式 拓展 
数 孔 重用 方式 :提取 不 同 KOS 中 的 类 或 概念 组 进行 
北 党 整合 ,涉及 同 义 术语 合并 、 关 系 融合 等 操作 ;@ 上 
传 领域 关键 词 并 同时 与 多 个 KOS 数据 进行 匹配 ,筛选 
史 呢 数据 进行 整合 ,涉及 术语 权重 计算 .关系 扩展 等 操 
作 e> 以 上 方式 可 支持 跨 领 域 知识 组 织 体系 的 快速 构 
4.6 建设 以 KOS 为 核心 的 知识 组 织 框架 

KOS 管理 工具 的 发 展 应 当 注重 互 操作 ,开放 性 和 
集成 能 力 ,支持 与 内 容 管 理 系统 ,标注 及 检索 系统 相 整 
合 ,形成 一 体 化 的 工作 流程 ,便捷 的 应 用 于 各 类 型 机 构 
的 知识 管理 业务 。 机 构 知识 组 织 建设 工作 中 ,应 当 将 
KOS 管理 工具 作为 核心 组 件 ,支持 各 类 型 数据 资源 的 
结构 化 与 分 类 、 知 识 实体 的 抽取 与 索引 、 检 索 语句 的 理 
解 与 分 析 等 功能 ,促进 KOS 数据 的 应 用 ,最 大 化 发 挥 
其 价值 。 

此 外 ,从 KOS 管理 工具 使 用 者 的 角度 来 看 ,不 同 
KOS 管理 工具 的 功能 存在 较 大 差异 。 开 源 软件 中 : 
Vocbench 各 方面 表现 均 十 分 突出 ,满足 语义 网 环境 下 
的 各 类 型 知识 组 织 体系 构建 ,但 它 与 第 三 方 系统 的 集 
成 主要 通过 编程 方式 调用 , 且 操 作 较 为 复杂 ,适合 具有 
词 表 、 本 体 等 KOS 编制 经 验 的 用 户 ;TemaTres、Unilexi- 
con 功能 较为 单一 , 仅 支 持 词 表 类 知识 组 织 体系 建设 ， 


能 满足 基础 的 项 目 管理 及 数据 管理 ,但 不 支持 语义 扩 
展 . 语 义 互 操作 等 性 能 ,适合 小 规模 词 表 建设 需求 的 用 
户 。 商 业 软 件 相 对 功能 较为 完善 且 有 良好 的 服务 保 
障 ,用 户 可 根据 自身 数据 建设 规模 与 应 用 需求 ,选择 合 
适 的 KOS 管理 工具 。 如 :中 普通 词 表 编制 用 户 可 选择 
MultiTes 或 Synaptica KMS 工具 ,其 中 Synaptica KMS 具 
备 良好 的 用 户 权 限 与 工作 流 管理 功能 ,并 且 支 持 拖 搜 
编辑 与 数据 内 容 的 图 形 化 展示 ,实现 KOS 数据 的 快速 
配置 。@ 具 有 多 类 型 知识 组 织 体系 构建 需求 的 用 户 可 
选择 Synaptica Graphite , Mondeca ITM 或 SKOS Shuttle, 
它们 功能 相似 且 各 有 特色 : Synaptica Graphite 支持 拖 搜 
编辑 ,以 及 数据 或 项 目 不 同 层面 的 可 视 化 展示 方式 ; 
Mondeca ITM 可 以 与 其 内 容 标 引 管理 工具 集成 ,并 从 
中 提取 实例 对 KOS 数据 进行 扩充 ;SKOS Shuttle 支持 
基于 文本 语 料 的 术语 抽取 ,实现 KOS 的 智能 化 更 新 。 
@@ 企 业 级 用 户 可 选择 PoolParty 或 TopBraid EDG-VM, 
它们 拥有 大 量 的 客户 应 用 案例 ,可 人 处 理 各 种 类 型 复杂 
化 数据 规模 化 的 词 表 和 本 体 , 同 时 提供 配套 的 内 容 标 
引 、 自 动 分 类 图谱 数据 管理 .知识 发 现 等 组 件 ,实现 与 
KOS 管理 工具 的 无 缝 集成 ,适合 企业 级 知识 组 织 体系 
构建 与 管理 。 


5 结语 


KOS 管理 工具 的 建设 是 实现 机 构 数 据 资 源 有 序 组 
织 \ 集 成 与 服务 的 核心 。 为 了 解 KOS 管理 工具 的 发 展 
现状 ,笔者 从 结构 定义 、 项 目 维 护 、 数 据 管理 、 互 操作 
性 操作 环境 5 个 维度 出 发 ,对 10 个 代表 性 KOS 管理 
工具 进行 调研 分 析 。 分 析 发 现 ,KOS 管理 工具 正 逐 渐 
顺应 用 户 需 求 及 技术 发 展 需求 ,依托 语义 网 .关联 数 
据 、 语 义 集成 .语义 互 操作 等 技术 促进 功能 创新 。 未 来 
KOS 管理 工具 的 建设 应 注意 以 下 几 个 方面 :灵活 设计 
并 配置 多 类 型 数据 模型 支持 可 持续 发 展 的 管理 与 维 
护 机 制 支持 用 户 分 布 式 协 同 管理 与 控制 .知识 驱动 的 
数据 迭代 式 更 新 ` 面 向 语义 的 KOS 重用 与 进化 、 建 设 
以 KOS 为 核心 的 知识 组 织 框 架 等 。 在 功能 分 析 基 础 
之 上 ,笔者 从 用 户 使 用 的 角度 出 发 给 出 了 KOS 管理 工 
具 选 择 建议 。 

本 研究 还 存在 一 定 的 不 足 , 如 未 将 用 户 的 使 用 
体验 纳入 评估 范畴 。 今 后 工作 中 ,可 总 结 归 纳 知识 
服务 过 程 中 来 自 最 终 用 户 、 项 目 管理 人 员 、KOS 数 
据 编 辑 人 员 的 实际 需求 ,同时 借鉴 现 有 KOS 管理 工 
具 的 优点 ,逐步 完善 自身 KOS 管理 工具 的 建设 工 
作 。 
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Comparative Analysis and Enlightenment of Foreign KOS Management Tools 
Ji Shanshan Zhao Bingrong Liu Zheng 
National Science Library, Chinese Academy of Sciences, Beijing 100190 

Abstract: | Purpose/significance | This paper compared and analyzed the current research status and key func- 
tions of representative knowledge organization system ( KOS) management tools under the development of semantic 
web ,sorts out the development trends of related research , and provided suggestions for the construction of knowledge 
organization system in various institutions. | Method/process | Through online survey, 10 representative foreign KOS 
management tools were selected, and their development status was compared and analyzed from the aspects of struc- 
tural definition, project maintenance, data government, interoperability, and operating environment. Based on the 
survey results, we proposed some suggestions for the construction of KOS management tools in China. | Result/con- 
sion] Relying on the development of technologies such as semantic Web, linked data, semantic integration, and 
CSemantic interoperation, the domestic construction of KOS management tools should gradually achieve functional inno- 
ion, including flexible design of multiple data models, project management that supports sustainable development, 
istributed collaborative user management, knowledge driven data updating, semantic-oriented data utilization, KOS 

«as the core of the knowledge organization framework , etc. 
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